我知道可以匹配一个单词,然后使用其他工具(例如grep -v)将匹配项反转。但是,是否可以hede使用正则表达式来匹配不包含特定单词的行?
输入:
hoho hihi haha hede
码:
grep "<Regex for 'doesn't contain hede'>" input
所需的输出:
hoho hihi haha
正则表达式不支持逆匹配的说法并不完全正确。您可以使用否定环顾模仿此行为:
^((?!hede).)*$
上面的正则表达式将匹配任何不包含(sub)字符串’hede’的字符串或没有换行符的行。如前所述,这是不是正则表达式是“好”的(或应该做的),但是,它仍然是可能的。
如果还需要匹配换行符,请使用DOT-ALL修饰符(s以下模式的结尾):
/^((?!hede).)*$/s
或内联使用:
/(?s)^((?!hede).)*$/
(其中/…/是regex分隔符,即不属于模式的一部分)
如果DOT-ALL修饰符不可用,则可以使用字符类模仿相同的行为[\s\S]:
/^((?!hede)[\s\S])*$/
说明 字符串只是n字符列表。每个字符之前和之后都有一个空字符串。因此,n字符列表将包含n+1空字符串。考虑字符串”ABhedeCD”:
┌──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┐ S = │e1│ A │e2│ B │e3│ h │e4│ e │e5│ d │e6│ e │e7│ C │e8│ D │e9│ └──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┘ index 0 1 2 3 4 5 6 7
其中e的是空字符串。正则表达式会(?!hede).向前看,看是否没有子字符串”hede”可以看到,如果是这种情况(可以看到其他情况),则.(点)将匹配除换行符以外的任何字符。环顾四周也称为零宽度断言,因为它们不占用任何字符。他们仅声明/验证某些内容。
因此,在我的示例中,”hede”在.(点)占用字符之前,首先对每个空字符串进行验证,以查看是否没有前面的字符串。正则表达式(?!hede).会做一次,所以它被包裹在一组,重复零次或多次:((?!hede).)*。最后,锚定输入的开始和结束以确保使用了整个输入:^((?!hede).)*$
((?!hede).)*
如您所见,输入"ABhedeCD"将失败,因为on上e3的regex(?!hede)失败了(正 “hede”前方!)。
"ABhedeCD"
regex(?!hede)